云平台 | LEfSe在线分析教程
一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线( http://cloud.lc-bio.com:5390/index.html);
还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南;
联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。
今天小编将与大家一起分享云平台里的LEfSe 在线分析教程,一起学起来吧~
LEfSe(LDA Effect Size)分析,可以用于两个或多个分组之间的比较,从而找到组间有显著性差异的物种(即biomarker),分析步骤主要分为三步:
Step1:利用Kruskal-Wallis秩和检验检测所有的特征物种,通过检测不同组间的物种丰度差异,获得显著性差异物种。
Step2:再利用Wilcoxon 秩和检验检测上步获得的显著性差异物种的所有亚种是否都趋同于同一分类级别。
Step3:最后用线性判别分析(LDA),得到最终的差异物种(即biomarker)。 LEfSe在线分析网址:
http://huttenhower.sph.harvard.edu/galaxy/
网页界面如下:
1.数据格式
一般微生物物种分析结果中都能得到OTU在不同分类水平的物种丰度结果,将数据格式转化为下图所示的网站标准输入格式,即可进行后续的分析。
2.上传数据
将标准格式的文件上传至网站:(Get Data->Upload File),具体设置如下图:
3.LEfSe 分析
步骤 A)Format Data for LEfSe 格式转化:
输出文件格式(该格式文件只是中间文件,具体意义不需要详细理解)如下:
4.LEfSe 分析
步骤 B) LDA Effect Size (LEfSe) 差异计算与统计:
输出结果:
各列意义如下:
第一列:物种信息;
第二列:平均丰度最大的log10的值,如果平均丰度小于10 按照10来计算 ;
第三列:差异物种富集的组名称;
第四列:LDA值;
第五列:Kruskal-Wallis秩和检验的P值,如果不是 biomarker,则用‘-’表示
5.LEfSe 分析——C-F 步骤均为作图
步骤 C)Plot LEfSe Results:
输出图形结果如下(如果差异过多或过少,可重新设置第四步参数并运算,然后作图):
步骤 D)Plot Cladogram(参数设置与步骤 C 类似):
输出结果:
图注:不同圆圈表示不同分类层级,从内至外,依次为门-纲-目-科-属。每个节点表示一种物种,黄色表示该物种在三组中无显著性差异,其他颜色,以groupA中的红色为例,如果节点颜色为红色则表示该物种在比较组中有显著性差异,且该物种在groupA中的丰度更高, 其他颜色以此类推。具体差异的门和纲直接在左侧图中标出,其他差异以字母表示,具体代表的物种在右侧标出。
步骤 E)Plot One Feature (画其中一个物种在不同组样品中的柱状图) :
结果展示:
图注:图中不同分组用黑实线隔开,每组柱状图中的实线表示该组样品表达量的平均值,虚线代表该组样品表达量的中位值。
步骤 F)Plot Differential Features (绘制差异物种或基因柱状图,输入设置与E步骤基本类似):
步骤E和F的区别在于,E每次只能做一张图,F可以绘制biomarker(或所有的物种)柱状图。一般建议跳过步骤 E,直接做步骤 F,步骤F的结果一般以压缩包的形式,下载到本地解压后即可查看每个 biomarker 在不同样品中的表达柱状图。
6.结果下载
LEfSe在线分析教程就分享完了,想去联川云平台学习更多技能的小伙伴可以关注下方注册和登录流程,需要本文章原文的请点击文末左下角“阅读原文”下载~
云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:
http://cloud.lc-bio.com:5390/app/signin.html
下载LEfSe在线分析教程原文的小伙伴请点击文末‘阅读原文’下载哦~
也欢迎给位给我们的云平台留言、提建议
在大家的督促下,我们的云平台会越做越好
云平台 | bio-Venn在线绘制Venn图